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摘要 : 

[目的 ] 本 文 针对 中 文 出 版 物 中 不 同 字 体 、 不 同 书写 系统 的 阅读 绩效 进行 客观 对 比 研究 。 

[方法 ] 具体 地 ， 将 汉字 泻 染 成 其 对 应 字形 的 图 像 ， 并 进一步 按照 语序 把 句子 中 的 汉字 图 像 折 又 成 为 三 维 
的 句子 张 量 。 对 于 同一 段 中 文 文本 ， 用 不 同 的 字体 或 者 简体 、 繁 体会 得 到 句子 的 视觉 差异 化 的 张 量 表达 。 
通过 进一步 将 得 到 句子 张 量 输入 到 我 们 设计 的 深度 语言 模型 ， 进 行文 本 分 类 等 任务 的 测试 ， 可 以 客观 地 比 
较 字体 和 书写 系统 对 阅读 绩效 的 影响 。 

[结果 ] 通过 在 两 个 中 文 文本 分 类 数据 集 上 的 测试 发 现 ， 一 些 特殊 不 常用 字体 相 较 于 常用 字体 的 机 器 识别 
准确 度 较 低 ， 并 且 常 用 字体 中 不 同 字体 的 阅读 绩效 也 有 差异 。 

[结论 ] 通过 假设 检验 得 出 使 用 楷体 和 黑体 的 数据 集 在 文本 分 类 任务 上 的 准确 度 存在 显著 性 差异 ， 楷 体 相 
比 于 黑体 来 说 阅读 绩效 更 高 。 简 体 中 文 和 繁体 中 文 的 阅读 绩效 存在 显著 性 差异 。 
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Abstract: 

[Objective] We study the reading performance of different fonts and writing systems that 
are using in Chinese publications 

[Methods] Specifically, the Chinese characters in a sentence are rendered into their 
corresponding glyph images, then fold those images into a three-dimensional sentence tensor 
according to the word order. For different fonts or simplified/traditional Chinese text, we 
can get the corresponding representations with visual differences. By inputting the obtained 
sentence tensor into the proposed deep language model, we test them on text classification, 
which can objectively study the influence of font and writing system on reading performance 
[Results] According to the experiments on two real-world Chinese text classification 
datasets, Toutiao and Thucnews, we found that the accuracy of text classification on some 
uncommon fonts is lower than that of common used fonts, and the text representation 
efficiency of different fonts in the common fonts is also different 


[Conclusions] Through a hypothesis test, we found that there is a significant difference in 
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the accuracy of using the data sets of regular Script and bold script for text classification 
task, and the _ efficiency of regular script is higher than that of bold script. There are 
significant differences in reading performance between simplified and traditional writing 
systems. 

Keywords: reading performance; text classification; deep neural network 

中 文 文字 的 不 同 字形 特征 在 阅读 中 会 产生 不 同 的 视觉 心理 效果 由 因而 会 带 来 阅读 绩效 上 
的 差异 。 比 如 ， 大 部 分 的 中 文 印 刷 品 、 网 页 的 正文 多 选用 楷体 或 宋体 ， 而 较 少 用 黑体 站。 对 于 
中 文 而 言 ， 除 了 字体 带 来 的 视觉 心理 差异 趾 ， 并 存 的 两 种 书写 系统 ， 简 体 中 文 和 繁体 中 文 ， 同 
样 会 给 文字 表达 效率 带 来 视觉 心理 上 的 差异 由 。 对 于 整个 汉字 体系 发 展 来 说 ， 有 些 简体 字 看 似 
没有 繁体 字 的 表意 属性 强 , 但 这 并 不 表明 简体 字 推 行 后 汉字 的 表意 属性 就 降低 了 四 。 如 ,“ 谭 ” 
简化 成 “全 ”、“ 注 ”简化 成 “ 炙 ” 后 ， 简 化 字 比 繁体 字 更 好 理解 。 关 于 简体 和 繁体 的 优 务 之 
争 的 研究 由 来 已 入 9, 与 此 同时 ,学界 部 分 学 者 力求 探讨 汉字 字体 的 视觉 传达 与 识别 性 能 。 
从 上 世纪 20、30 年 代 起 ， 汉 字 实 验 研究 一 直 都 是 语言 学 界 、 心 理学 界 共同 关注 的 课题 。 语 言 
学 家 对 汉字 的 各 种 识别 研究 多 从 文字 学 角度 入 手 外 ， 如 汉字 结构 特征 与 汉字 识别 相关 性 等 课题 。 
另 有 一 批 专家 立足 于 汉字 信息 学 及 认 知 心理 学 相关 知识 四， 对 人 类 识别 汉字 信息 符号 的 心理 过 
程 进 行 仿真 模拟 ， 用 以 解决 汉字 计算 机 信息 处 理 识别 系统 中 存在 的 各 种 现实 问题 。 除 此 之 外 ， 
一 些 学 者 从 生理 学 540、 心 理学 0 角度 出 发 ， 对 汉字 不 同 字体 的 辨别 率 做 实验 性 研究 。 如 ， 金 
文雄 等 [5 以 判读 正确 率 为 指标 ， 在 三 种 照明 条 件 下 ， 比 较 了 宋体 、 黑 体 、 长 仿宋 体 和 正 仿宋 体 
四 种 汉字 字体 的 阅读 绩效 。 

已 有 的 关于 汉字 字体 识别 的 研究 ,多 来 自 于 与 文字 相关 的 社会 学 领域 ， 基 本 是 从 语言 文字 
学 、 心 理学 等 角度 出 发 ， 其 研究 的 方法 因 学 科 性 质 大 多 较为 主观 。 本 文 试图 用 机 器 阅读 来 客观 
地 研究 中 文字 体 、 书 写 系统 和 文本 阅读 绩效 的 关系 。 自 然 阅读 的 阅读 绩效 可 以 用 机 器 文本 分 类 
的 准确 率 来 近似 ， 后 者 是 前 者 在 机 器 阅读 上 的 同等 概念 。 
具体 地 , 我 们 利用 文字 字形 来 作为 文本 的 表达 , 然后 输入 自然 语言 模型 来 进行 文本 分 类 测 
试 。 即 ,将 句子 的 单词 或 字符 演 染 成 图 像 ， 然 后 将 它们 折 著 成 三 维 句子 张 量 x € Rw*hx!， 其 中 
w 是 单词 或 字符 图 像 的 大 小 ，1 是 句子 的 长 度 , 如 图 1 所 示 。 每 个 切片 Xi; € Rw** 对 应 一 个 单 
词 或 一 个 字符 图 像 。 因 此 , 句子 可 以 被 一 个 三 维 句子 张 量 x 来 表达 。 进 而 ,我 们 把 同一 段 文本 
按照 不 同 字 体 或 者 不 同 书 写 系统 表达 成 对 应 的 句子 张 量 的 形式 , 并 在 机 器 语言 模型 下 测试 其 识 
别 性 能 。 本 文中 ， 基 于 句子 的 张 量 表达 ,利用 Liu 等 提出 的 三 维 卷 积 语言 模型 3 来 近似 计算 阅 
读 绩效 。 

本 文 的 主要 贡献 包括 2 个 方面 : 

1) 从 机 器 阅读 的 角度 , 提出 一 种 客观 评价 中 文 简体 、 繁 体 等 不 同 书写 系统 ,以 及 不 同 字体 
的 阅读 绩效 的 方式 ; 

2) 利用 假设 检验 ， 在 头条 数据 集 和 清华 数据 集 上 验证 了 不 同 书写 系统 、 不 同 字 体 对 阅读 
绩效 的 影响 。 

通过 在 两 个 中 文 文本 分 类 数据 集 上 的 测试 发 现 , 常用 字体 和 不 常用 字体 的 阅读 绩效 存在 差 
异 。 一些 常用 字体 ， 比 如 楷体 和 黑体 的 阅读 绩效 也 存在 显著 差异 。 简体 和 繁体 两 个 书写 系统 的 
阅读 绩效 具有 显著 性 差异 。 


y 


1 研究 方法 


1.1 概论 
首先 我 们 将 一 个 句子 5 演 染 成 一 个 如 图 1 所 示 的 三 维 的 张 量 ， 其 中 这 个 张 量 的 每 一 个 切 


片 对 应 于 一 个 汉字 ， 即 8 中 的 汉字 vw 被 演 染 为 图 像 X; € 民 ”**。 然 后 将 5S 中 每 个 字 按 顺序 折 翅 
成 三 维 句 子 张 量 xX € Rw**x!， 其 中 w 是 单词 或 字符 图 像 的 大 小 ，! 是 句子 的 长 度 。 我 们 将 大 
小 为 w Xh xm 的 三 维 卷 积 核 应 用 于 “文本 张 量 ”， 其 中 w 和 有 分 别 是 字符 图 像 的 宽度 和 高 
度 ，n 是 字符 数 。 换 言 之 ，3D 卷 积 一 次 滑动 作用 于 n 个 字符 ， 相 当 于 一 次 n-gram 的 特征 检 
测 。 我 们 可 以 通过 改变 的 值 ， 得 到 不 同 大 小 的 n-gram 检测 器 ， 并 可 以 使 用 多 个 n-gram 卷 
积 来 提取 文本 特征 。 例 如 ， 在 我 们 的 实验 中 , 可 以 取 {2，3，4，5} 的 值 。 在 我 们 所 提出 的 
框架 下 ， 多 个 n-gram 的 集成 可 以 非常 容易 和 快速 地 实现 。 

在 神经 网 络 语言 建 模 中 ， 正 序 和 反 序 的 文本 信息 是 两 种 不 同 的 输入 53。 我 们 采用 双向 卷 
积 来 提取 文本 特征 。 


Fig. 1 Three-dimensional sentence tensor 


图 1 三 维 句 子 张 量 


1.2 网 络 搭建 


神经 网 络 的 体系 结构 可 以 描述 如 下 01: 
1， 三 维 卷 积 层 : kernel size = (20.20，2) stride = (1, 1, 1), number of kernels = 50, padding = 


kernel size = (20,20,3), stride = (1, J, 1), number of kernels = 50, padding = 0; 

kernel size = (20,20,4), stride = (1, J, 1), number of kernels = 50, padding = 0; 

kernel size = (20,20,5), stride = (7 J, 1), number of kernels = 50, padding = 0; 

2. MaxPoolld 层 (the max-over-time pooling): kernel size = 3, stride = 3, dilation = 2, padding 
SO 

3. 全 连接 层 1: input = 100*99, output =1100; 

4. 全 连接 层 2: input =1100, output = 120; 

5. 全 连接 层 3: input = 120, output = 关 功 数 和 旧 


2 实验 过 程 


2.1 实验 配置 


根据 现 有 的 数据 集 ， 我 们 从 文本 分 类 的 任务 上 来 测试 不 同 字 体 和 简体 中 文 、 繁 体 中 文 的 分 
类 准确 率 。 这 里 分 类 准确 率 可 以 近似 等 价 于 阅读 绩效 。 

数据 集 如 表 1 所 示 。THUCNews 数据 集 ! 鸭 是 根据 2005 年 至 2011 年 从 新 浪 新 闻 RSS! 订 
阅 渠 道 获得 的 历史 数据 生成 的 。 原 始 的 清华 数据 集 是 14 分 类 ， 但 是 个 别 分 类 样本 太 少 ， 为 了 
避免 出 现 样本 不 均衡 问题 ， 我 们 删除 掉 样 本 比较 少 的 4 个 类 别 ， 最 终 我 们 使 用 的 数据 集 为 10 
类 。Toutiao 新 闻 数 据 集 从 Toutiao App 收集 文本 。 每 个 项 目 包 含 新 闻 的 标题 和 关键 词 。 数 据 
处 理 参照 文献 [13] 。 对 于 所 用 的 两 个 数据 集 ， 表 1 中 给 出 了 训练 、 验 证 和 测试 的 样本 大 小 。 


1 https://rss.sina.com.cn/ 


Table 1 Splitting ofthe sample size for training,validation and testing of the datasets for text classification. 
表 1 用 于 训练 、 验 证 和 测试 文本 分 类 数据 集 的 样本 大 小 的 拆 分 
Datasets Training Validation Testing Classes Average length Content 


THUCNews 16000 2000 2000 10 251 News 
Toutiao 266318 37666 76471 15 38 Title and keywords 


2.2 不 同 字 体 之 间 假 设 检 验 

我 们 将 流行 出 版 物 中 使 用 频率 高 的 字体 列 为 常用 字体 。 常 用 字体 来 源 于 Windows 自 带 字 
体 库 ， 不 常用 字体 来 源 于 方正 字库 ?。 

常用 字体 : 宋体 (SIMSUN)， 楷 体 (STKAITID)， 黑 体 (SIMHEI)， 等 线 (DENG)， 华 文 仿宋 
(STFANGSO)。 

不 常用 字体 : 方正 舒 体 (FZSTK)， 方 正字 迹 -长 江 行 书简 体 (FZZJ-CJXSJW)， 方 正大 草 简体 
(FZDCJW)， 方 正 鲁 迅 简 体 (FZLUXTJW)， 方 正字 迹 -欧阳 长 迪 行 楷 (FZZJ-OYCDXKJW)。 


2.2.1 常用 字体 和 不 常用 字体 检验 

我 们 将 这 两 个 数据 集 泻 染 成 5 种 常用 字体 和 5 种 不 常用 字体 ， 然 后 在 它们 上 运行 m 次 文 
本 分 类 任务 。 从 表 2 中 的 结果 可 以 看 出 ， 常 用 字体 和 不 常用 字体 有 不 同 的 形式 ， 它 们 在 阅读 绩 
效 上 也 有 一 定 的 差异 。 
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Fig. 2 SIMSUN、 STKAITI、 SIMHEI、 FZZJ-CJXSJW、 FZLUXTJIW、 FZZJ-OYCDXKJW 
图 2 宋体 、 楷 体 、 黑 体 、 方 正字 迹 -长 江 行书 简体 、 方 正和 鲁迅 简体 、 方 正字 迹 - 欧 阳 长 迪 行 楷 的 视觉 效果 展 
未 


Table 2 The results of text classification task for data sets with different fonts 


表 2 对 不 同 字 体 的 数据 集 进行 文本 分 类 任务 结果 展示 


Fonts Toutiao (m=40) THUCNews(m=40) 
STKAITI 玉 休 0.85075 0.9325 
STFEANGSO 作文 态 实 0.85075 0.93125 


2 https:/www.foundertype.com/index.php/FindFont/index 


SIMHEIT 禾 伏 0.84625 0.92975 


SIMSUN 突 从 0.8495 0.93025 

DENG 等 疆 0.8495 0.93000 

FZDC1 刺 方 大 大 党 篇 所 0.84775 0.9315 

FZSTK 方正 处 人 的 0.8465 0.93000 
FZLUXTJW 方 /让 鲁 这 蘑 休 0.84975 0.93075 
FZ2ZJ-OYCDXKJIW 方 丰 守信 撤 所 长 池 找 检 0.84375 0.92925 
FZZJ-CIXSJW 方太 字 人 洲 长江 打 改 世 休 0.8395 0.92875 


92 93 94 
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Fig. 3 The classification and recognition accuracy distribution of common fonts and uncommon fonts, where (a) is 
the Toutiao dataset and (b) is the Thucnews dataset. 
图 3 常用 字体 和 不 常用 字体 的 分 类 识别 准确 率 分 布 ， 其 中 (a) 是 头条 数据 集 ，(b) 是 清华 数据 集 。 


Table 3 The average classification and recognition accuracy of five commonly used fonts and five rarely used fonts 


表 3 五 种 常用 字体 分 类 识别 准确 率 均值 和 五 种 不 常用 字体 分 类 识别 准确 率 均值 


Fonts Toutiao(m=200) Thucnews(m=200) 
Common 0.84935 0.93075 
Uncommon 0.84545 0.93005 


图 3 展示 了 在 头条 数据 集 和 清华 数据 集 上 使 用 常用 字体 和 不 常用 字体 进行 分 类 识别 任务 的 准 
角 率 分 布 。 对 第 用 字体 和 不 常用 字体 阅读 绩效 的 假设 检验 结果 如 表 4 所 示 : 


EN 


Table 4 Hypothesis test on reading performance of data sets using common and uncommon fonts 


表 4 对 使 用 常用 字体 和 不 常用 字体 的 数据 集 阅 读 绩效 的 假设 检验 
dataset TT 万 语 历 度 尸 和 俯 
toutiao 8.036 362.275 1.3266e-14 
thucnews 2.300 397.633 0.0220 


Ho: 机 器 对 使 用 常用 字体 和 不 常用 字体 的 阅读 绩效 无 显著 性 差异 

头条 数据 集 检 验 统计 量 {=8.036 ， 自 由 度 为 362.275， 双 尾 检 验 p 值 = 1.3266e-14。 在 显著 
性 水 平 设 为 0.05 下 ，p 值 小 于 显著 性 水 平 wo， 所 以 拒绝 原 假设 ， 有 统计 显著 ， 即 模型 对 使 用 
常用 字体 和 不 常用 字体 的 头条 数据 集 的 阅读 绩效 存在 显著 差异 。 


清华 数据 集 检验 统计 量 t 值 =2.300 自由 度 为 397.633 双 尾 检验 p 值 = 0.0220。 在 显著 性 水 
平 设 为 0.05 下 ，p 值 小 于 显著 性 水 平 ag， 所 以 拒绝 原 假设 ， 有 统计 显著 ， 即 模型 对 使 用 和 常用 
字体 和 不 常用 字体 的 清华 数据 集 阅 读 绩效 存在 显著 差异 。 

根据 以 上 两 个 数据 集 得 出 的 结论 ， 常 用 字体 与 不 常用 字体 之 间 的 阅 刘 卖 绩效 是 存在 显著 差 
异 的 ， 也 就 是 说 不 同 字体 的 阅读 绩效 确实 存在 显著 差异 。 这 就 很 好 的 解释 说 明了 为 什么 很 多 
印刷 书籍 是 有 字体 的 常用 选择 范围 的 。 阅 读 绩效 高 的 的 字体 能 帮助 人 们 阅读 ， 给 人 们 更 好 的 
阅读 体验 ， 而 不 适宜 的 字体 适得其反 ， 严 重 妨 碍 阅读 也 会 影响 图 书 的 销量 。 


2.2.2 常用 字体 间 的 检验 


宋体 、 黑 体 、 楷 体 、 仿 宋 、 等 线 虽 然 都 作为 基本 常用 字体 ， 但 依然 存在 阅读 绩效 的 差 
异 。 接 下 来 我 们 对 常用 字体 的 阅读 绩效 排序 ， 在 表 5 中 可 以 看 到 ， 在 头条 数据 集中 ， 阅 读 绩 
> 高 的 字体 为 楷体 ， 最 低 的 字体 为 黑体 ， 在 清华 数据 集中 ， 阅 读 绩效 最 人 

华文 仿宋 ， 最 低 的 字体 为 黑体 。 我 们 进一步 检验 使 用 楷体 和 黑体 的 两 个 数据 集 阅 读 绩效 有 无 
显著 差异 。 
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Fig. 4 Hypothesis tests are presented in bold and regular fonts 
图 4 假设 检验 所 用 黑体 和 楷体 字体 展示 
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Table $ shows the results of text classification of datasets with different common fonts 


表 5 对 使 用 不 同 常用 字体 的 数据 集 文本 分 类 的 结果 展示 
Commonfonts Toutiao(m=40) Thucnews(m=40) 


STKAITI 0.85075 0.9325 
STFANGSO 0.85075 0.93125 
Simsun 0.8495 0.93025 
DENG 0.8495 0.93 
SIMHET 0.84625 0.92975 


Fig. $ The classification and recognition accuracy distribution of bold and regular type, where (a) is the Toutiao 
dataset and (b) is the Thucnews dataset. 
图 5 黑体 和 楷体 的 分 类 识别 准确 率 分 布 ， 其 中 (a) 是 头条 数据 集 ，(b) 是 清华 数据 集 。 
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Table 6 Hypothesis tests on reading performance of feature rendering with regular and bold characters 


表 6 模型 对 使 用 楷体 和 黑体 的 数据 集 阅 读 绩效 的 假设 检验 
dataset 7 每 后 历 度 P 谍 
Toutiao -4.4227 66.837 3.6756e-05 
Thucnews -3.7310 48.971 0.0005 

图 5 展示 了 在 头条 数据 集 和 清华 数据 集 上 使 用 黑体 和 楷体 进行 分 类 识别 任务 的 准确 率 分 
布 。 对 黑体 和 楷体 阅读 绩效 的 假设 检验 结果 如 表 6 所 示 . 

Ho: 机 器 对 使 用 楷体 和 黑体 的 阅读 绩效 无 显著 性 差异 

头条 数据 集 检验 统计 量 t 值 = -4.4227， 自 由 度 为 66.83, 双 尾 检验 p 值 = 3.6756e-05。 在 显著 
性 水 平 设 为 0.05 下 ，p 值 小 于 显著 性 水 平 a， 所 以 拒绝 原 假设 ， 有 统计 显著 ， 即 模型 对 使 用 
楷体 和 黑体 的 头条 数据 集 的 阅读 绩效 存在 显著 性 差异 。 

清华 数据 集 检验 统计 量 t 值 = -3.7310， 自 由 度 为 48.971， 双 尾 检 验 p 值 =0.0005。 在 显著 
性 水 平 设 为 0.05 下 ，Pp 值 小 于 显著 性 水 平 ag， 所 以 拒绝 原 假设 ， 有 统计 显著 ， 即 模型 对 使 用 
楷体 和 黑体 的 清华 数据 集 的 阅读 绩效 存在 显著 性 差异 。 

我 们 以 上 实验 可 以 得 出 结论 ， 使 用 楷体 和 黑体 的 数据 集 的 阅读 绩效 存在 显著 性 差异 ， 楷 
体 的 阅读 绩效 相对 来 说 比 黑体 高 些 。 我 们 猜想 从 视觉 上 来 看 ， 楷 体 结构 部 位 之 间 互 不 连接 ， 
字体 清楚 ， 而 黑体 横竖 的 笔 形 粗细 是 相等 的 ， 文 章 如 果 通 篇 采用 黑体 给 读者 阅读 ， 每 一 个 字 
都 非常 醒目 ， 会 使 读者 产生 视觉 疲劳 ， 而 楷体 相 比 于 黑体 ， 笔 画 没 有 那么 粗壮 ， 视 觉 上 给 人 
直观 清楚 的 效果 ， 所 以 这 也 符合 我 们 黑体 一 般 用 于 标题 ， 楷 体 一 般 用 于 正文 的 排版 习惯 ， 较 
易于 人 们 阅读 。 


2.3 简体 中 文 和 繁体 中 文 假设 检验 


中 文 存在 两 种 写作 系统 ， 即 简体 中 文 和 繁体 中 文 。 几 乎 所 有 的 汉语 方言 都 是 基于 这 两 个 
写作 系统 ， 一 般 繁体 中 文 比 简 体 中文 有 更 多 的 笔画 。 多 年 来 ， 人 们 对 繁体 中 文 和 简体 中 文 进 
行 了 广泛 的 争论 ， 例 如 ， 繁 体 中 文 和 简体 中 文 的 区 别 ， 哪 一 个 更 有 效率 等 等 。 

这 一 部 分 我 们 在 模型 框架 下 比较 了 简体 中 文 和 繁体 中 文 的 阅读 绩效 差异 。 我 们 在 头条 数 
据 集 和 清华 数据 集 上 分 别 使 用 简体 中 文 和 繁体 中 文 ， 然 后 运行 40 次 文本 分 类 任务 。 


邯 隔 同 阿 区 上 东信 奈 剑 忆 
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Fig. 6 Simplified and Traditional Chinese Fonts 
图 6 简体 和 繁体 字体 展示 
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Fig. 7 The classification and recognition accuracy distribution of simplified and traditional characters, where (a) is 
the Toutiao dataset and (b) is the Thucnews dataset. 
图 7 简体 和 繁体 的 分 类 识别 准确 率 分 布 ， 其 中 (a) 是 头条 数据 集 ，(b) 是 清华 数据 自 
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Table 7 Text expression efficiency of Simplified Chinese and Traditional Chinese on different data sets 


表 7 简体 中 文 和 繁体 中 文 在 不 同 数 据 集 上 的 阅读 绩效 
Chinese Toutiao(m=40) Thucnews(m=40) 


writing system 
Simplified 0.8495 0.93025 
Chinese 
Traditional 0.8450 0.9295 
Chinese 


图 7 展示 了 在 头条 数据 集 和 清华 数据 集 上 使 用 简体 和 繁体 进行 分 类 识别 任务 的 准确 率 分 
布 。 对 简体 和 繁体 阅读 绩效 的 假设 检验 结果 如 表 8 所 示 : 


Table 8 Hypothesis test on reading performance of data sets using simplified and traditional characters 


表 8 模型 对 使 用 简体 和 繁体 的 数据 集 阅读 绩效 的 假设 检验 
dataset “T 访 后 历 度 尸 往 
Toutiao 5.152 53.304 3.8302e-06 
Thucnews 1.747 70.683 0.0850 


Ho: 机 器 对 使 用 简体 和 繁体 的 阅读 绩效 无 显著 性 差异 

头条 数据 集 检验 统计 量 t 值 =5.152， 自 由 度 为 53.304， 双 尾 检验 p 值 = 3.8302e-06， 在 显 
著 性 水 平 设 为 0.05 下 ,，p 值 小 于 显著 性 水 平 a， 所 以 拒绝 原 假设 ， 有 统计 显著 ， 即 模型 对 使 
用 简体 和 繁体 的 头条 数据 集 的 阅读 绩效 存在 显著 性 差异 。 

清华 数据 集 检验 统计 量 t 值 =1.747， 自 由 度 为 70.683， 双 尾 检验 p 值 = 0.0850， 在 显著 性 
水 平 设 为 0.05 下 ，p 值 大 于 显著 性 水 平 g， 所 以 不 拒绝 原 假设 ， 无 统计 显著 ， 即 没有 充足 的 
理由 证 明 模 型 对 使 用 简体 和 繁体 的 清华 数据 集 的 阅读 绩效 存在 显著 性 差异 。 

简体 和 繁体 两 个 书写 系统 ， 繁 体 字 注 重 表意 ， 每 个 字 都 有 渊源 ， 每 个 字 意 都 有 详细 的 演 
化 过 程 ， 字 形 和 字义 相 融 匹配 。 而 简体 字 笔 画 减 少 ， 一 字 多 义 情 况 也 时 常 发 生 ， 这 对 模型 的 
识别 效率 也 有 一 定 的 影响 。 在 头条 数据 集 上 的 结果 显示 繁体 和 简体 的 阅读 绩效 存在 显著 差 


异 ， 而 在 清华 数据 集 上 结果 显示 它们 的 阅读 绩效 不 存在 显著 差异 。 我 们 猜想 是 因为 头条 数据 


集 样 本 比较 短 ， 准 确 率 计 算 起 来 更 加 精细 ， 所 以 头条 数据 集 准确 率 都 比 清华 数据 集 低 ， 而 清 
华 数据 集 样 本 较 长 ， 所 以 对 使 用 简体 中 文 和 繁体 中 文 的 数据 集 阅 读 绩效 差异 不 大 。 由 于 在 头 
条 数据 集 上 假设 检验 的 结果 已 经 有 充足 的 理由 拒绝 无 显著 差异 的 原 假设 ， 所 以 我 们 认为 ， 模 
型 对 使 用 繁体 和 简体 的 数据 集 阅读 绩效 存在 显著 性 差异 。 


3 结论 

通过 句子 张 量 ， 句 子 中 文本 特征 都 可 以 通过 多 个 n-gram 以 正常 顺序 和 反 向 顺序 提取 。 为 
了 研究 中 文 不 同 字 体 和 不 同 书写 系统 的 识别 差异 ， 我 们 在 几 个 数据 集 上 进行 文本 分 类 任务 。 
最 后 ， 我 们 根据 在 不 同 书写 系统 、 不 同 字 体 下 数据 集 文 本 分 类 的 准确 率 做 假设 


检验 ， 假 设 检验 结果 为 常用 字体 和 不 常用 字体 的 阅读 绩效 存在 差异 。 常 用 字体 中 楷体 和 
黑体 的 阅读 绩效 也 存在 显著 性 差异 。 简 体 和 繁体 两 个 书写 系统 的 阅读 绩效 存在 显著 性 差异 。 
本 研究 结果 证 实 了 书面 出 版 物 使 用 的 字体 存在 阅读 绩效 的 差异 。 但 本 研究 使 用 的 不 常用 字体 
仅 来 源 于 方正 字库 ， 其 他 不 常用 字体 的 表达 效率 还 需 进一步 研究 。 
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